iT邦幫忙

data engineer相關文章
共有 144 則文章

技術 【Day 32】 蒐集證交所公開資料 / 取得每日成交量排行前二十大股票

在沒有行情的收盤或假日時段,也可以找點事情來做。 好比是回顧歷史,借古鑑今。 判斷一檔股票是否熱絡,可以直接從「交易量排行榜」很直觀地看出。 而去撈取交易量 “...

技術 【Day 29】 做題庫小試身手 - 11

先前我們針對 ExamTopics 的免費 32 題進行了準備。接下來,你還可以註冊 AWS Skill Builder 去看免費的課程,做免費題庫。(雖然根據...

鐵人賽 AI/ ML & Data DAY 30

技術 DAY 30 Dbt 跟文件說的不一樣!你真的需要 dbt 嗎?

為什麼我們需要 dbt?我們真的需要它嗎? 今天又在 Medium 看到這篇 No, Data Engineers Don’t NEED dbt.,在談論到底需...

技術 【Day 29】 做題庫小試身手 - 10

題目 題庫 Questions Q33 A company has a frontend ReactJS website that uses Amazo...

技術 Databricks Certified Data Engineer Associate 高分備考指南- Overview

前言 這是一篇關於如何取得Databricks Data Engineer Associate的備考指南,希望可以通過這一篇文章幫助大家也可以取得證照。 Pre...

技術 【Day 28】 做題庫小試身手 - 9

題目 題庫 Questions Q30 A company is migrating a legacy application to an Amazon...

技術 【Day 27】 做題庫小試身手 - 8

題目 題庫 Questions Q27 A company wants to implement real-time analytics capabil...

技術 【Day 26】 做題庫小試身手 - 7

題目 題庫 Questions Q23 A company currently stores all of its data in Amazon S3...

技術 【Day 25】 做題庫小試身手 - 6

題目 題庫 Questions Q19 A data engineer must orchestrate a series of Amazon Athe...

技術 【Day 24】 Amazon MQ / Amazon Managed Streaming for Apache Kafka (MSK)

RabbitMQ 是由 Rabbit 公司所開發。 不過因為公司被 VMware 收購再被 Broadcom 收購,是誰的好像不是那麼重要。 Apache Ka...

技術 【Day 23】 Amazon Kinesis Firehose 的簡單介紹

前一回,稍微看過了 Amazon Kinesis Data Streams,今天來說說另外一個也冠名 Kinesis 的服務 - Amazon Kinesis...

技術 【Day 22】 Amazon Kinesis Data Streams 的簡單介紹

在前面做題庫的部分,出現了關於 「Amazon Kinesis Data Streams」,所以今天來說說這個服務。 REF Amazon Kinesis...

技術 【Day 21】 做題庫小試身手 - 5

題目 題庫 Questions Q15 A data engineer needs to securely transfer 5 TB of data...

技術 【Day 20】 做題庫小試身手 - 4

題目 題庫 Questions Q11 A data engineer needs Amazon Athena queries to finish fa...

技術 【Day 19】 Hadoop / Spark / Amazon EMR

考古 Hadoop 是在 2006 時,就已經問世的老東西了。 而大概在十年前的時候,Spark 針對記憶體的方面進行優化和改良,利用物理的方式超車了 Hado...

技術 【Day 18】 做題庫小試身手 - 3

題目 題庫 Questions Q7 A financial services company stores financial data in Ama...

技術 【Day 17】 AWS 上的容器服務

現在已經 2024,距離 Docker Container 問世已經 11 年半了。 關於容器的優缺點和特性,可以參考先前我分享在 2022 的文章:【Day...

技術 【Day 15】 做題庫小試身手 - 2

題目 題庫 Questions Q4 A financial company wants to implement a data mesh. The d...

鐵人賽 DevOps DAY 3

技術 【Day 3】DataOps 是什麼?

1. DataOps 名稱由來 DataOps 最早是 Lenny Liebmann 在 2014 年提出,主要是為了優化數據流的整合和自動化,進而確保數據質量...

鐵人賽 AI & Data DAY 30

技術 『Day30』Data pipeline 優化以及結語

今天就是鐵人賽最後一天了,回想過去的一個月裡真的做了很多的事情,感謝鐵人賽能讓我的生活變得更豐富(爆炸?)以及充實。透過這次的鐵人賽也讓我有機會能夠整理關於 D...

鐵人賽 AI & Data DAY 29

技術 『Day29』DAG 程式碼設計優化方向

不知不覺已經來到鐵人賽最後兩天了,加油!在讀本篇文章的讀者們,非常感謝你們一路的支持!在本系列的初期,我們有介紹到 Airflow 的設計概念,其中一個很重要的...

鐵人賽 AI & Data DAY 28

技術 『Day28』部署 DAG

在我們開發完成 DAG 之後,通常並非一次性就結束了,隨著時間過去,需求有持續不斷的改變,而我們的程式也必須持續的修改以及優化。有一個良好的開發流程以及 CI/...

鐵人賽 AI & Data DAY 27

技術 『Day27』來幫 DAG 寫寫測試吧

在我們開發 weather_dag 之後,我們介紹了如何透過 View 以及警報來監控 DAG 執行的狀況。在開發之後其實還有一件非常重要的事,那就是測試,對於...

鐵人賽 AI & Data DAY 26

技術 『Day26』加入警報讓 Airflow 主動通知

上一篇跟大家分享了 Airflow 功能強大的各種 View。而這篇要來跟大家分享警報的實作方法。不同於 View 是開發者以及維運人員需要主動進行查看,警報則...

鐵人賽 AI & Data DAY 25

技術 『Day25』使用 View 來監控執行狀況

在前兩天中,我們開發了天氣資訊的 DAG,我們知道在軟體工程的實踐中,開發只是一個部分,開發完成之後,後續的維運、監控以及持續的修正也是非常的重要。Airflo...

鐵人賽 AI & Data DAY 24

技術 [Day 24] - 資料處理和特徵工程 🔢 (下) | Rust x Jupyter 資料工程 🦀

今日份 Ferris 今天 Ferris 要大展身手了! Rust REPL REPL(讀音:REH-ple)代表 Read-Eval-Print Loop,是...

鐵人賽 AI & Data DAY 24

技術 『Day24』來做個天氣資訊 DAG 吧 (下)

昨天我們建立了天氣資訊 DAG 的基本架構和流程。今天我們來繼續實作細部的 Task 工作。首先我們從 Extract Function 進行實作。 實作 Ex...

鐵人賽 AI & Data DAY 23

技術 『Day23』來做個天氣資訊 DAG 吧 (上)

還記得我們第一次寫的 first_dag 嗎?當時只是基本的寫了一個 DAG 的雛形,在經過這幾天更了解 DAG 各個元件之後,大家是不是覺得躍躍欲試呢,相信大...

鐵人賽 AI & Data DAY 22

技術 『Day22』Operator 介紹

在對於外部的連結之後,我們再細部介紹一下 Operator 的使用,其實在 Operator 層級也可以有不同的使用方法。Operator 本身有多種種類,其作...

鐵人賽 AI & Data DAY 21

技術 『Day21』使用 Conn、Hook 進行外部連接

到目前為止我們了解,DAG 如何建立,如何設定關聯關係,如何傳遞變數。而在Data pipeline 當中還有很重要的一個部分是與外部系統溝通。 Airflow...